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RESUMEN 


En esta investigación se crearon diferentes modelos de Redes Neuronales Convolucionales variando los 
parámetros de filtro y épocas con la finalidad de mejorar el aprendizaje sobre las distintas clases del 
conjunto de imágenes. Así mismo, se subdividió el conjunto de imágenes en imágenes de entrenamiento, 
prueba y validación, este último para comprobar la eficiencia en la clasificación de del modelo creado el 
cual presento una eficiencia de 87.5% y el cual se acerca a las mejores encontrados en la literatura. 
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ABSTRACT 


In this research, different models of Convolutional Neural Networks were created, varying the filter 
parameters and times in order to improve learning about the different classes of the set of images. Likewise, 
the set of images was subdivided into training, test and validation images, the latter to verify the efficiency 
in the classification of the created model which presented an efficiency of 87.5% and which is close to the 
best found in the literature. 
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1. INTRODUCCIÓN 


Según la Organización Mundial de la Salud, el cáncer es un proceso de crecimiento 
incontrolado de células (tumor) que pueden crecer prácticamente en cualquier parte de 
cuerpo y es capaz de extenderse a puntos distintos del organismo. Existen diversos tipos 
de cáncer que se pueden curar mediante cirugías, radioterapias o quimioterapias, 
especialmente si se detectan a tiempo. Cada tipo de cáncer posee características 
particulares, que en algunos casos son completamente diferentes, tanto en síntomas como 
en tratamientos. Entre los más comunes, en cuando a su índice de mortalidad se refiere, 
está el Cáncer de Pulmón, Cáncer Hepático, Colorrectal, Gástrico y Mamario. 


El cáncer es la principal causa de muerte en el mundo por enfermedad; En el 2015, 
ocasionó 8,8 millones de defunciones, casi una de cada seis defunciones que se producen 
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el mundo es debido a esta enfermedad (OMS, 2018). Las causas de esta enfermedad se 
le atribuyen a factores genéticos y tres categorías de agentes externos, como los 
carcinógenos físicos, como las radiaciones ultravioletas e ionizantes; carcinógenos 
químicos, como el amianto, los componentes del humo de tabaco, las aflatoxinas (e.g., 
contaminantes de los alimentos) y el arsénico (e.g., contaminante del agua de bebida), y 
carcinógenos biológicos, como determinados virus, bacterias y parásitos (OMS, 2018). 


A pesar de que los anteriores son los tipos de cáncer más comunes en cuanto mortalidad 
se refiere, en este trabajo se va a delimitar al cáncer de piel que es por mucho el más 
común (pero no la más mortal) entre todos los tipos de cáncer. El principal factor 
ambiental para sufrir cáncer de piel es la Radiación Ultravioleta, bien sea que provenga 
de la exposición solar o de una fuente artificial como las cámaras de bronceo. Así, 
cualquier persona que recibe diariamente su influencia, sin protegerse, estará en riesgo de 
desarrollar la enfermedad. 


El cáncer de piel suele aparecer sobre las zonas de la piel que no están cubiertas por la 
ropa ni protegida con bloqueador solar y que diariamente reciben la influencia de la 
radiación Ultravioleta: la cara, las orejas, cuero cabelludo (en los hombres con alopecia) 
el cuello, los brazos y las piernas. Pueden ir desde lunares de aspecto inusual, manchas 
negras, heridas espontáneas en la cara que no sanan, verrugas de crecimiento progresivo, 
lunares inflamados o la aparición de tumores sobre la piel. 


Los tres tipos de cáncer piel más frecuentes son carcinoma basocelular, carcinoma 
escamo-celular y melanoma, este último es el más agresivo y que con mayor frecuencia 
produce metástasis (reproducción o extensión de una enfermedad o de un tumor a otra 
parte del cuerpo). El melanoma conforma solo 1% de los casos de cáncer de piel, pero es 
causa de la gran mayoría de muertes por este tipo de cáncer (ACS, 2016) 


Existen diversas maneras de predecir Cáncer de Piel en los pacientes. Por lo general, el 
doctor obtendrá su historial médico y hará preguntas sobre cambios de tonalidad en la 
piel. También se pueden realizar variaciones de biopsias con muestras de la piel, así como 
estudios por imágenes como: Radiografía de Tórax, Tomografía Computarizada, 
Resonancia Magnética y Tomografía por emisión de positrones (ACS, 2016)]. Los 
estudios por imágenes no son necesarios para personas con melanoma en etapa muy 
temprana, el cual es muy poco probable que se haya propagado. 


2. MARCO TEÓRICO 


El término Visión por Computadora ha sido muy utilizado en los últimos años y tiende a 
ser confundido con otros conceptos. Algunos de ellos son, Ciencia que desarrolla las bases 
teóricas y algorítmicas para obtener información sobre el mundo real a partir de una o 
varias imágenes (Shapiro, 1992). Este dice que es la disciplina que desarrolla sistemas 
capaces de interpretar el contenido de escenas naturales (Castleman, 1996). 


Gracias a que el área del cerebro responsable de la visión es una de las zonas más 
estudiadas y que más se conoce; se sabe que la corteza visual contiene una disposición 
jerárquica compleja de neuronas. La corteza visual de los animales es el más potente 
sistema de procesamiento visual que se conoce, por lo que suena lógico inspirarse en ella 
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para crear una variante de redes neuronales artificiales que ayude a identificar imágenes; 
es así como surgen las redes neuronales convolucionales (CNN). En pocas palabras, son 
redes neurales capaces de construir funciones completas a partir de otras menos complejas 
(Developer, 2018). 


Durante los últimos años se han desarrollado diversas investigaciones en el tema Visión 
por computadora para diversos propósitos o con alguna tarea en específico. 


Amirreza (2018), realizó una clasificación del Cáncer de Piel utilizando diferentes 
Algoritmos de Redes Neurales de Aprendizaje Profundo, en el que se estudió la 
efectividad y capacidad de las Redes Neuronales Convolucionales en la clasificación de 
ocho enfermedades de la piel utilizando diferentes arquitecturas pre entrenadas como 
DenseNet y ResNet con el objetivo de comparar la capacidad del Deep Learning con el 
rendimiento de dermatólogos altamente capacitados. Los mejores valores para el 
melanoma y el carcinoma de células de base son 94.40% con ResNet 152 y 99.30% con 
DenseNet 201 contra 82.26% y 88.82 de dermatólogos, respectivamente. 


Lee et all (2018), diseñaron un modelo, que vuelve a muestrear las imágenes de lesiones 
cutáneas pre procesadas, además construye una arquitectura de red neuronal afinada con 
datos segmentación, y utiliza un método conjunto para clasificar las siete enfermedades 
de la piel. Logrando una precisión de la 0.899 y 0.785 en el conjunto de validación y 
prueba, respectivamente. 


Li and Li (2018),] muestran un diseño, experimentos y resultado de una solución 
presentada en el desafío de la ISIC 2018: Skin Lesion Analysis Towards Melanoma 
Detection. Se diseña un modelo utilizando Redes Neuronales Convolucionales (CNN) 
para pruebas de segmentación y diagnóstico de lesiones. 


Pierluigi, et al (2018), utilizaron una Red Neuronal Convolucional profunda basada en la 
arquitectura DenseNet junto con una metodología de aprendizaje altamente 
discriminatoria, para clasificar siete tipos de lesiones cutáneas. El sistema propuesto 
realizó una puntuación global de 89.2% en la fase de validación del desafío (Challenge, 
2018). 


Se logró un proceso considerable en el uso de aplicaciones automatizadas para la 
clasificación precisa de las lesiones cutáneas a partir de imágenes digitales. Se formó una 
red neuronal convolucional basada en la arquitectura ResNet 50 para clasificar con 
precisión las imágenes de dermatoscopia de las lesiones de la piel en una de las siete 
categorías de enfermedades, obteniendo una precisión equilibrada de 91% en el conjunto 
de datos de validación. 


La formación de Redes Neuronales para el diagnóstico automatizado de lesiones cutáneas 
pigmentadas se ve obstaculizado por el pequeño tamaño y falta de diversidad de los 
conjuntos de datos disponibles de imágenes dermatoscopias. Tschandl et al (2018) 
abordaron el tema lanzando el conjunto de datos HAM10000 (Human Against Machine 
con 10000 imágenes de entrenamiento). Las imágenes se recolectaron de diferentes 
poblaciones y modalidades. Dada esta diversidad, se tuvo que aplicar diferentes métodos 
de adquisición y limpieza y desarrollamos flujos de trabajo semiautomáticos utilizando 


redes neuronales específicamente capacitadas. 
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Codella et all (2018), describieron el diseño, la implementación y los resultados de la 
última entrega del desafío de referencia de análisis de imágenes dermatoscopias. El 
desafío se dividió en 3 tareas: segmentación de lesiones, detección de características y 
clasificación de enfermedades. Los conjuntos de datos utilizados durante el desafío están 
disponibles para futuras investigaciones y desarrollos, tal como el data set HAM10000 
utilizado en este trabajo. 


Estudios recientes han demostrado el uso de Redes Neuronales Convolucionales (CNN) 
para clasificar imágenes de melanoma con precisiones comparables a las logradas por 
dermatólogos certificados. Sin embargo, el rendimiento de una CNN entrenada 
exclusivamente con imágenes dermatoscopias en una tarea de clasificación de imágenes 
clínicas en competencia directa con un gran número de dermatólogos no se ha medido 
hasta la fecha. Brinker et al (2019) compararon el rendimiento de una Red Neuronal 
Convolucional entrenada con imágenes dermatoscopias exclusivamente para identificar 
el melanoma en fotografías clínicas con la clasificación manual de las mismas imágenes 
por dermatólogos. 


Motsch et all (2018), explicaron el método utilizado en el desafío de segmentación en el 
desafío de detección de lesiones cutáneas de International Skin Imaging Collaboration (1 
Kechyn, SIC) en 2018. Se entrenó una red U-Net para realizar la segmentación. 


Kechyn, (2018), aborda el problema de la detección automática del límite de lesiones 
dermatoscópicas, utilizando Redes Neuronales Profundas basadas en la adaptación de la 
CNN U-Net con conexiones de omisión para la tarea de segmentación del límite de lesión. 
El mejor modelo logró resultados con 0.752. Otros experimentos con diferentes 
arquitecturas y modelos únicos lograron resultados entre 0.700 y 0.750. 


Lu et al (2018) resumen los métodos utilizados en el concurso ISIC 2018: Skin Lesion 
Analysis Towards Melanoma Detection, donde se utilizó un modelo de CNN llamado 
GrassNet y una combinación de U-Net y ResNet entre otros modelos, obteniendo una 
puntuación de 0.781 en la primera presentación de validación, después de 280 épocas de 
entrenamiento (11 minutos por época), en una PC con una tarjeta gráfica GTX 1070. 


Ray, (2018), propone una técnica de clasificación para las imágenes de lesiones de la piel 
como parte su presentación en (Challenge, 2018), donde.se utilizó una CNN ResNet50 
así como DeepFores con capas en cascada para clasificar las imágenes. Se dividió el 
dataset en un conjunto de entrenamiento y un conjunto de pruebas con una relación de 
división de 0.1. La precisión de entrenamiento obtenida fue del 97.15%. La precisión de 
prueba fue del 80.04% 


Ebenezer y Rajapakse. (2018), utilizaron un método totalmente automático para 
segmentar con precisión los límistes de las lesiones a partir de imágenes dermatoscópicas 
usando una Red U-Net. En las presentaciones se obtuvieron índices Jaccard de 0.756, 
0.750 y 0.746 en el conjunto de validación de 100 imágenes. (Challenge, 2018). 


Goyal y Rajapakse (2018), usaron una arquitectura de una Red Neuronal Profunda (DNN) 
que puede clasificar eficazmente las lesiones cutáneas mediante el uso de la recopilación 
de datos y el embolsado para abordar la escasez de datos y evitar el exceso de 
información. El conjunto está compuesto por dos arquitecturas DNN: Inception-v4 e 


Inception Resnet-v2. 
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Kitada y Iyatomi (018), perfeccionaron múltiples modelos de Redes Neuronales 
previamente entrenadas basadas en redes de compresión y excitación (SENet) que logran 
resultados de vanguardia en el campo del reconocimiento de imágenes. Además, se 
utilizan algunas estrategias de aumento de datos especialmente diseñadas para el análisis 
de lesiones de la piel con un 87.2% de precisión. 


3. METODOLOGÍA 


Para el desarrollo de esta investigación se utilizaron las imágenes de lesiones 
dermatoscopias, las cuales se adquirieron a partir del conjunto de datos HAM10000 a 
través de varias instituciones (Codella et all ,2018). El conjunto de datos de 
entrenamiento consiste en 10,015 imágenes (327 de Queratosis actínica y carcinoma 
intraepitelial AKIEC, 514 de Carcinoma de células basales BCC, 1099 de Queratosis 
benigna BKL, 115 de Dermatofibroma DF, 1.113 de Melanoma MEL, 6,705 de Nevos 
melanocíticos NV y 142 de muestras de Lesiones vasculares VASC) con la etiqueta de 
enfermedad correspondiente y un conjunto de validación con 1,167 muestras. Las 
enfermedades correspondientes a cada etiqueta se muestran en la Tabla 1. 


Tabla 1 Etiquetas del conjunto de Datos 


Etiqueta Enfermedad 


AKIEC Queratosis actínica y carcinoma intraepitelial 
BCC Carcinoma de células basales 

BKL Queratosis benigna 

DF Dermatofibroma 

MEL Melanoma 
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NV Nuevos melanocíticos 


VASC Lesiones vasculares 


Con el conjunto de imágenes se creó una de Red Neuronal Convolucional (CNN) 
utilizando Keras y Tensor Flow, en donde se dividió el conjunto de imágenes en 3 partes: 
entrenamiento 80%, prueba 10 y validación 10%. Dichas imágenes que serán clasificadas 
a partir de los diferentes tipos de cáncer como se muestra en la Tabla 1. Los parámetros 
definidos en este estudio para la creación de los distintos modelos CNN. Los parámetros 
definidos son: Anchura de la imagen, Altura de la imagen, * de ejemplos de 
entrenamiento, + de pasos, $ de épocas, + de características de la primera capa Convl, + 
de características de la segunda capa Conv2 y Filtro. En donde se fue ajustando los pesos 
de a partir de la variación de los filtros en cada Kernel, la variación de las épocas, los 
pasos, la longitud de altura y los filtros en la primera capa de la red y la segunda con la 
finalidad de que el modelo fuera aprendiendo a partir de cada convolución. Por otro lado, 
se fueron dejando fijos los parámetros que generaron mejores resultados con respecto a 
la convolución anterior. 


3.1 Experimentación con las variables del algoritmo de entrenamiento 

En esta sección se muestran los resultados obtenidos de cada entrenamiento con diferentes 
valores de las variables de los diferentes modelos. Los resultados se observan en la Tabla 
2. 


Tabla 2 Experimentos de entrenamiento 


Exp Épocas Longitud,  Batch_s Pasos Val. steps Conv1 Conv2 Fil Fil2 Pool Loss ace 
altura ize 
CNN1 20 150, 150 32 10000 10015 8 16 BS (242 (22 - 0.6695 
CNN2 20 150, 150 32 10000 10015 16 32 (3,3) (2,2) (2,2) 5.3275 0.6695 
CNN3 15 200, 200 32 10000 10015 16 32 (33) (22) (22) 5.3264 0.6695 
CNN4 20 150, 150 32 1000 1000 8 16 (3,3) (2,2) (2,2) 1.2834 1.3094 
CNN5 30 150, 150 64 10000 1000 16 32 (3,3) (2,2) (2,2) 1.1774 0.5652 
CNN6 40 150, 150 64 100000 10000 16 32 (3,3) (22) (2,2) 10824 0.5714 
CNN7 40 200, 200 32 100000 10000 16 32 (3,3) (2,2) (2,2) 10126 0.5714 
CNN8 40 150, 150 32 100000 10000 16 64 (33) (22) (22) 1.1941 0.5292 
CNN9 80 150, 150 32 100000 10000 32 64 (3,3) (2,2) (2,2) 0.6081 0.7665 
CNN10 80 150, 150 32 1000000 100000 32 64 (33) (22) (22) 0.6241 0.7602 
CNN11 120 150, 150 32 1000000 100000 32 64 (333) (22) (22) 0.3692 0.8745 
CNN12 120 150, 150 32 10000 10000 32 64 (3,3) (2,2) (2,2) 0.3345 0.8708 
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La cantidad de imágenes en cada clase de la data set utilizado era diferente, por ello en 
los primeros tres experimentos la ganancia es la misma sin importar la variación en los 
valores de las variables. Debido a esto, se balanceo el conjunto de imágenes, dejando 115 
imágenes en cada clase y utilizando las imágenes restantes para la predicción, esto del 
conjunto de entrenamiento. Se realizaron diferentes pruebas con el set de validación, 
balanceándose con 44 imágenes con cada una de las diferentes clases del modelo. 


4. RESULTADOS Y DISCUSIÓN 


La precisión del entrenamiento obtenida en los primeros experimentos con el conjunto de 
datos no balanceado fue del 66.95% como se puede observar en los experimentos 1, 2 y 
3 de la Tabla 2 en la Sección 3.1. La mejor precisión de entrenamiento obtenida con el 
conjunto de datos balanceado fue la del experimento del CNN11 con 87.45%. No 
obstante, la precisión en el experimento del CNN2 disminuyo levemente con respecto al 
experimento CNN11 con 87%. Por lo que se notó al realizar una comparación, que la 
precisión de las convoluciones CNN11 y la convolución CNN12 es poco significativa, 
manejando el mismo número de épocas, filtros y solo variando la cantidad de pasos. 


Una vez obtenido el modelo y pesos del entrenamiento se hicieron pruebas de predicción 
utilizando las imágenes restantes del balanceo, obteniendo los resultados que se muestran 
en la Tabla 3. 


Tabla 3 Porcentaje de predicción 


Clase Porcentaje 
Akiec 29.54% 
Bcc 4.54% 

BkI 0% 

Df 90.90% 
Mel 0% 

Nv 79.54% 
Vasc 29.54% 


Análogamente, los porcentajes en 0% que se presentan en las clases Mel y BKL se puede 
asociar con la similitud que existe entre las imágenes de dichas clases con la clase Nv. 
Cuando se ejecuta se prueba el modelo de predicción con imágenes de la clase BKL y 
Mel, se predice en su mayoría como si fueran Nv. Es posible notar también el alto 
porcentaje de clasificación de la clase Dermatofibroma (DF) con un 90% seguido de la 
clase Nuevo melanocitos (Nv) con 79.84% 
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5. CONCLUSIÓN 


Con este trabajo se investigó la capacidad de las Redes Neuronales Convolucionales de 
clasificar las 7 principales lesiones en la piel. Así mismo se crearon distintos modelos 
variando los diferentes parámetros determinados para el experimento, llevándonos a 
determinar la importancia del aumento de la época en la capacidad con la que aprende el 
modelo y el filtro con la eficiencia que lo hace. Así mismo se comprobó la similitud que 
tienen 3 de las lesiones en la piel, como lo son Nuevos melanocíticos NV, Queratosis 
benigna (Bkl) y Melanoma (Mel). Esta similitud también puede corresponder a la gran 
cantidad de imágenes que se tienen de la clase NV con respecto a Bkl y Mel, las cual 
posiblemente puede que esté llevando a un sesgo. Por otro lado, el modelo CNN11 fue 
capaz de clasificar las imágenes de las diferentes clases no mencionadas como Bcc, 
Akiec, Df y Vasc. Comparando con los resultados encontrados en la literatura el 
porcentaje de nuestro modelo no es el mejor; Mas sin embargo se acerca al resultado de 
los mejores con conjunto de imágenes privados similares para la predicción de lesiones 
de la piel. Para un desarrollo futuro sobre esta investigación, dependerá de la reducción 
de imágenes a por clase de tal manera que se balancee a partir de la clase que menor 
cantidad de imágenes presente y también a la identificación de características y reducción 
de estas en los filtros de los Kernel que nos puedan llevar a mejorar el modelo presentado. 
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